心理 科学 进展 2018, Vol. 26, No. 4, 667-677 
Advances in Psychological Science 


Chinayv nA 
C hinaA IVE 


DOI: 10.3724/SP.J.1042.2018.00667 


系统 的 神经 机 制 


£EA ERG! BERR? MoH! BX? 


(华南 师范 大 学 心理 学 院 , 广州 510631) C 重 庆 师 范 大 学 教育 科学 学 院 ,重庆 401331) 
G 深 圳 市 精神 卫生 中 心 /深圳 市 康宁 医院 儿 少 精神 科 ,深圳 518020) 


摘 要 行为 学 习 双 系统 模型 认为 行为 习 得 涉及 两 个 系统 : 目标 导向 学 习 系 统 与 习惯 学 习 系 统 ， 前 者 是 对 行 
为 反应 与 结果 之 间 的 联结 进行 动态 加 工 的 学 习 系 统 ,与 尾 状 核 、 腹 内 侧 前 额 叶 皮质 、 眶 额 叶 皮 质 相关 ; 后 者 是 
对 刺激 -反应 关系 自动 化 加 工 的 学 习 系 统 ， 与 壳 核 、 辅 助 运动 区 相关 。 这 两 种 行为 学 习 系统 的 研究 范式 主要 有 


结果 贬值 范式 和 偶然 性 降低 范式 。 大 量 研究 发 现 强迫 症 、 


自 半 症 、 成 瘦 等 心理 、 精 神 疾病 均 表现 出 目标 导向 


学 习 系 统 与 习惯 学 习 系统 缺 损 ， 且 这 种 缺损 在 患 病 不 同 阶 段 呈 现 动 态 变化 过 程 。 
关键 词 ”目标 导向 学 习 系统 ; 习惯 学 习 系 统 ; BRE: 党 核 ; 刻板 行为 
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在 日 常生 活 中 ,为 适应 纷繁 复杂 的 环境 , 个 
体会 采用 习惯 、 自 动 化 的 动作 来 提高 生活 、 工 作 
效率 ， 比 如 进门 顺手 脱衣 服 并 挂 在 固定 位 置 ; 警 
察 办 案 时 对 罪犯 采取 的 一 系列 手 到 擒 来 的 动作 。 
同时 , 个 体 需要 抑制 某 些 习惯 行为 ,有 意识 地 调 
整 自 己 的 行为 以 应 对 各 种 突 发 状况 ,或 灵活 适应 
环境 的 变化 ， 比 如 去 朋友 家 拜访 时 进门 顺手 脱衣 


环境 ,同时 也 消耗 较 多 的 认 知 资源 ,增加 工作 记 
忆 的 负荷 (Cushman & Morris, 2015; Dolan & Dayan, 
2013; Gesiarz & Crockett, 2015), 2J 825 2] AR 
被 称 为 无 模型 学 习 系 统 (Model-free learning), 

对 先前 形成 的 刺激 -反应 联结 进行 强化 的 结果 ， 
行为 反应 仅 基于 刺激 信号 ， 而 不 考虑 结果 的 改变 ; 
它 是 一 种 自动 化 、 高 效 但 不 灵活 的 行为 习 得 机 制 ， 


il & 


服 就 不 太 妥 当 ; 警察 办 案 时 的 系列 反应 不 宜 带 入 
家 庭 生活 。 根 据 行为 学 习 的 双 系 统 模型 ， 这 两 种 
不 同 的 行为 模式 涉及 到 两 个 关键 的 行为 学 习 系 统 
一 一 目标 导向 学 习 系统 (Goal-direct learning system) 
和 习惯 学 习 系 统 (Habitual learning system) (Cushman 
& Morris, 2015; Dolan & Dayan, 2013; Hadj- 
Bouziane et al., 2013). 

目标 导向 学 习 系 统 也 被 称 为 基于 模型 的 学 习 
系统 (Model-based learning)， 是 一 种 对 行为 反应 
与 潜在 结果 间 的 联结 进行 深入 、 动 态 加 工 的 学 习 
机 制 , 根据 结果 的 价值 变化 调整 行为 反应 ; CR 
有 和 较 高 的 灵活 性 ,能 够 迅速 适应 不 断 变 化 的 外 界 
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通常 占用 较 少 的 认 知 资源 (Cushman & Morris, 
2015; Dolan & Dayan, 2013; Gesiarz & Crockett, 
2015)。 正 常情 况 下 , 个 体 在 做 出 行为 反应 时 其 目 
标 导向 学 习 系 统 与 习惯 学 习 系 统 能 够 根据 外 界 环 
境 的 变化 密切 配合 、 灵 活 切 换 (Cushman & Morris, 
2015; Dolan & Dayan, 2013; Gesiarz & Crockett, 
2015)。 例 如 ， 随 着 过 度 训 练 , 个 体 对 任务 熟悉 度 
的 增加 ， 目 标 导 向 行为 会 逐渐 向 习惯 行为 过 渡 ; 
当 外 界 环境 发 生变 化 时 , 个体 又 会 重新 采用 目标 
导向 学 习 系 统 对 行为 反应 进行 调整 与 转换 (Dolan 
& Dayan, 2013)。 对 这 两 种 行为 学 习 系 统 的 研究 范 
式 主要 有 两 类 , 一 类 是 结果 贬值 范式 (Outcome 
Devaluation，OD)， 男 一 类 是 偶然 性 降低 范式 
(Contingency Degradation, CD), 这 两 种 范式 都 能 
很 好 地 区 分 个 体 的 目标 导向 行为 和 习惯 行为 
(Balleine & O'Doherty, 2010; Dolan & Dayan, 
2013). 

前 人 关于 动物 研究 、 脑 损伤 研究 、 脑 影像 学 
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研究 均 表 明 目 标 导 向 学 习 系统 和 习惯 学 习 系 统 的 
神经 机 制 存在 一 定 差 异 ， 前 者 主要 与 背 内 侧 纹 状 
体 (dorsal medial striatum, DMSA 入 尾 状 核 (caudate)、 

腹 内 侧 前 额 叶 皮质 (ventromedial prefrontal cortex, 
vmPFC), HET Rz (orbitofrontal cortex, OFC), 

前 扣 带 回 皮质 (anterior cingulate cortex, ACC)# VJ 
相关 (Gremel & Rui, 2013; Jahanshahi, Obeso, 
Rothwell, & Obeso, 2015; Wunderlich, Dayan, & 
Dolan, 2012); 而 后 者 主要 与 背 外 侧 纹 状 体 (dorsal 
lateral striatum, DLS) c fZ(putamen) 、 辅 助 运动 区 
(supplementary motor area SMA). fii & A X 
(Jahanshahi et al., 2015; Morris et al., 2016; 


理论 将 此 归 因 于 随 着 练习 次 数 的 增多 ， 刺 激 与 反 
应 之 间 的 联结 增强 , 行为 得 到 易 化 ; 然而 托 尔 曼 
则 认为 动物 习 得 了 对 环境 的 “ 认 知 地 图 *"， 以 此 为 
导向 进行 反应 ,并 提出 了 潜伏 学 习 的 观点 (Dolan 
& Dayan, 2013; Isoda & Hikosaka, 2011)。 在 这 一 
争论 的 基础 上 产生 了 对 目标 导向 学 习 与 习惯 学 习 
的 初始 研究 。 此 时 研究 者 倾向 于 采用 非 此 即 披 的 
二 分 观点 ,提出 目标 导向 行为 需 满足 (Dolan & 
Dayan, 2013; Gesiarz & Crockett, 2015): (1) 该 行为 
反映 了 行为 -结果 之 间 的 知识 ，(2) 行 为 结果 在 决 
策 中 起 着 动机 人 作用。 习惯 行为 需 满足 (Dolan & 
Dayan, 2013; Gesiarz & Crockett, 2015): 自动 化 、 


Wunderlich et al., 2012)。 神 经 递 质 研 究 显示 两 种 行 
为 学 习 系 统 与 谷 氨 酸 、y- 氨 基 丁 酸 (y-aminobutyric 
acid, GABA)“ Tl Avs it A X (Fettes, Schulze, & 
Downar，2017)。 此 外 ,这 两 种 行为 学 习 系 统 的 送 
乱 与 许多 心理 问题 、 精 神 疾病 及 神经 疾病 的 临床 
症状 密切 相关 ， 如 强迫 症 (Gillan & Robbins, 2014)、 
自 闭 症 (Alvares,，Balleine, Whittle, & Guastella, 
2016), JS (Sebold et al., 2014)、 应 激 (Schwabe & 
Wolf, 2011) 、 精 神 分 裂 证 (Culbreth，Westbrook, 
Daw, Botvinick, & Barch, 2016) 、 帕 金森 证 (De Wit, 
Barker, Dickinson, & Cools, 2011) 等 。 

本 文 综 述 了 国内 外 目标 导向 学 习 系统 与 习惯 
学 习 系 统 的 研究 现状 , 主要 涉及 两 种 行为 学 习 系 
统 的 神经 机 制 及 其 在 心理 精神 疾病 中 的 应 用 两 方 
面 。 首 先 ， 回 顾 了 目标 导向 学 习 与 习惯 学 习 的 研 
究 历史 进程 及 其 研究 范式 ; 其 次 , 分 别 介绍 目标 
导向 学 习 系 统 、 习 惯 学 习 系 统 的 神经 机 制 研究 现 
状 ; 再 次 ， 从 多 角度 综述 了 目标 导向 学 习 系 统 和 
习惯 学 习 系 统 在 心理 、 精 神 疾病 研究 中 的 具体 应 
JH; 最 后 ,对 当前 研究 进行 了 总 结 ,， 并 提出 了 目 
前 该 领域 待 解决 的 一 些 关 键 问题 。 


1 目标 导向 -习惯 学 习 系 统 研究 历程 及 
其 常用 范式 


1.1 目标 导向 -习惯 学 习 系 统 研究 历程 回顾 

目标 导向 学 习 系 统 与 习惯 学 习 系 统 最 早 发 端 
于 心理 学 中 行为 主义 刺激 -反应 观点 与 托 尔 曼 认 
知 地 图 的 争论 (Dolan & Dayan, 2013; Gesiarz & 


计算 高 效 、 不 灵活 等 特征 。 人 研究 者 们 通过 大 量 精 
巧 的 动物 行为 实验 范式 ,， 如 CD. OD 范式 发 现 动 
W DMS 与 DLS 分 别 在 两 种 学 习 系 统 中 起 不 同 作用 
(Balleine & O'Doherty, 2010; Gremel & Rui, 2013). 
随 着 技术 的 进步 ， 这 些 行 为 范式 逐渐 应 用 于 人 类 
两 种 行为 学 习 系 统 的 神经 机 制 研 究 。 进 一 步 研 究 
发 现 人 类 DMS, vmPFC, OFC, ACC 等 脑 区 与 目 
标 导 向 学 习 相 关 (Balleine & O'Doherty, 2010); 而 
壳 核 、SMA 等 区 域 则 与 习惯 学 习 密 切 联系 
(Balleine & O'Doherty, 2010)。 前 一 阶段 的 丰富 研 
究 成 果 ， 促 成 了 对 于 两 种 行为 学 习 系 统 更 准确 地 
理论 解释 。 随 着 计算 机 建 模 技 术 、 机 器 学 习 等 方 
法 的 进步 ， 研 究 者 基于 强化 学 习 理 论 提出 基于 模 
型 的 学 习 系 统 和 无 模型 学 习 系 统 两 种 模式 ， 并 对 
两 种 模式 的 竞争 与 合作 提出 多 种 计算 模型 
(Cushman & Morris, 2015; Daw, Niv, & Dayan, 2006), 
进行 了 更 深入 地 研究 与 探索 (详细 研究 历程 见 Dolan 
& Dayan, 2013)。 
12 目标 导向 -习惯 学 习 系 统 常用 范式 

研究 目标 导向 学 习 系 统 与 习惯 学 习 系 统 的 常 
用 范式 主要 有 两 种 : OD 和 CD 范式 (Balleine & 
O'Doherty, 2010)。OD 范式 分 两 步 (具体 见 Gillan & 
Robbins，2014),， 首先 ， 让 被 试 习 得 刺激 与 结果 之 
间 的 固定 联系 ， 即 建立 操作 性 条 件 学 习 的 过 程 。 
其 次 ,在 进行 消退 测试 之 前 ,撤销 掉 其 中 一 个 刺 
激 对 应 的 结果 ,考察 被 试 对 于 已 撤销 结果 的 刺激 
(贬值 结果 ) 与 未 撤销 结果 的 刺激 的 反应 差异 。 若 被 
试 减少 了 对 贬值 结果 相应 行为 的 反应 ， 则 其 行为 


Crockett, 2015; Gillan & Robbins, 2014)。 早期 研究 
发 现 随 着 训练 次 数 和 经 验 的 增多 , 动物 到 达 目 标 
的 时 间 越 来 越 短 ， 错 误 率 也 越 来 越 低 ; 刺激 -反应 


是 以 目标 为 导向 的 ; 大 被 试 仍 继续 执行 与 贬值 结 
果 相 对 应 的 行为 ， 也 就 是 说 对 结果 的 价值 变化 不 
敏感 ， 即 表现 出 习惯 行为 。 
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CD 范式 中 (具体 见 Balleine & O'Doherty, 2010; 
Balleine, Killeross & Dickinson, 2003) 引 入 了 独立 
于 行为 反应 的 随机 结果 。 被 试 首先 接受 两 种 操作 
性 行为 的 训练 ， 每 种 行为 对 应 不 同 的 结果 。 在 随 
后 的 CD 任务 中 ,撤销 其 中 一 种 反应 -结果 之 间 确 
定 的 对 应 关系 ， 即 无 论 被 试 反应 与 否 , 结果 总 会 
根据 一 定 的 概率 出 现 。 接 下 来 为 测验 阶段 ， 若 被 
试 减少 了 结果 按 概率 出 现 的 反应 ， 则 认为 其 行为 
是 目标 导向 的 ; 者 被 试 依 旧 按 照 训练 阶段 做 出 反 
应 ， 就 认为 是 习惯 行为 。 


2 目标 导向 学 习 系统 及 其 神经 机 制 研究 


早期 关于 动物 目标 导向 学 习 系 统 神经 机 制 的 
研究 显示 ， 额 叶 缘 前 皮层 (prelimbic cortex) 和 DMS 
在 动物 进行 目标 导向 学 习 中 起 重要 作用 (Balleine 
& O'Doherty, 2010)。 缘 前 皮层 受 损 的 动物 无 法 习 
得 新 的 目标 导向 行为 , 但 不 影响 已 经 习 得 的 目标 
导向 行为 的 表现 (Ostlund & Balleine, 2005). mi 
DMS 则 在 目标 导向 行为 的 习 得 与 表现 过 程 中 均 
起 到 重要 作用 ， 即 该 区 域 受 损 的 动物 不 仅 无 法 习 
得 目标 导向 行为 ， 其 原 有 的 目标 导向 行为 也 会 受 
到 影响 (Yin, Knowlton, & Balleine，2004)。 此 外 ， 
Michael 等 人 还 发 现 腹 侧 纹 状 体 ( 伏 隔 核 ) OFC 与 
动物 的 目标 导向 行为 习 得 密切 相关 ， 其 中 腹 侧 纹 
状 体 主 要 与 反应 -奖赏 的 习 得 有 关 , 而 OFC 在 根 
据 奖赏 的 变化 对 行为 的 调节 中 起 着 重要 作用 
(McDannald, Lucantonio, Burke, Niv, & Schoenbaum, 
2011)。Gremel 和 Rui (2013) 发 现 ， 在 不 同 的 行为 
学 习 过 程 中 , DMS、DLS、OFC 的 神经 元 活动 不 
同 , 在 目标 导向 行为 学 习 中 DMS 和 OFC 神经 元 
活动 增强 ，DLS 神经 元 活动 减少 ; 而 在 习惯 行为 
JEP, DLS 和 OFC 神经 元 活动 增强 , DMS 
神经 元 活动 减少 。 基 于 此 ,人 研究 者 认为 OFC 主要 
涉及 对 行为 奖赏 的 评估 ,而 DMS 与 DLS 与 行为 
策略 的 调整 有 关 (Gremel & Rui, 2013)。 神 经 递 质 
研究 显示 , 目标 导向 学 习 系 统 与 额 叶 - 纹 状 体 - 下 
丘脑 (subthalamic nucleus, STN)- 额 叶 间 接 通 路 中 
GABA、 谷 氨 酸 密切 相关 , 纹 状 体 释 放 GABA 至 
外 侧 苍白 球 (globus pallidus externa, GPe), 减轻 其 
对 STN 的 抑制 ,导致 STN 释放 更 多 兴奋 性 神经 递 
质 到 内 侧 苍白 球 (globus pallidus interna, Gpi) 与 黑 
质 密 部 ， 增 加 苍白 球 内 侧 和 黑 质 密 部 对 丘脑 的 抑 
制作 用 ， 导 致 丘脑 谷 氮 酸 释放 减少 ,进而 降低 额 


叶 的 兴奋 ,该 环 路 主要 参与 有 意 地 运动 控制 、 
应 抑制 (Haber, 2016; Jahanshahi et al., 2015)。 

人 类 的 目标 导向 学 习 系 统 主要 与 DMS, 
vmPFC, OFC, ACC 等 脑 区 密切 相关 (Balleine & 
O'Doherty, 2010; Wunderlich et al., 2012)。 这 些 区 
域 均 有 着 大 量 神 经 投射 连接 ,共同 组 成 了 与 额 叶 
-内 侧 纹 状 体 认 知 控制 环 路 (Associative circuit) 
(Jahanshahi et al., 2015; Postuma & Dagher, 2006)。 
其 中 OFC,vmPFC 主要 负责 价值 表征 和 结果 评估 ， 
并 将 价值 判断 信息 传递 到 基底 神经 节 区 域 ; 而 尾 
IRIZ. E AHER (globus pallidus), 、 黑 质 (substantia 
nigra，SN) 等 区 域 则 整合 来 自 额 叶 皮层 的 信息 参 
与 反应 选择 和 行为 习 得 ， 并 再 次 将 信息 反馈 至 前 
额 叶 区 域 , 共同 实现 基于 目标 导 癌 的 行为 反应 过 
程 (Fettes et al., 2017; Haber, 2016)。 其 具体 机 制 
如 下 : 

OFC 在 表征 目标 的 价值 中 起 重要 作用 。 一 方 
面 OFC 对 目标 的 价值 进行 编码 ， 同 时 按照 任务 要 
求 对 目标 价值 的 变化 进行 优 次 排序 (Fettes et al., 
2017; Valentin, Dickinson, & O'Doherty, 2007); 4 
一 方面 OFC 对 行为 反应 的 价值 进行 评估 ,并 在 行 
为 反应 中 起 仲裁 作用 (Lee, Shimojo, & O’ Doherty, 
2014)。Valentin 等 (2007) 采 用 以 食物 为 奖赏 的 OD 
范式 ， 比 较 被 试 在 对 撤销 的 奖赏 (让 被 试 对 这 种 食 
物产 生 饱 腹 感 ) 与 未 撤销 的 奖赏 进行 反应 时 其 脑 
区 激活 的 差异 ， 发 现 内 侧 OFC 激活 降低 , 说 明 
OFC 对 行为 结果 的 价值 变化 敏感 , O'Doherty (2011) 
也 有 类 似 的 发 现 ,。 此 外 ,也 有 研究 者 发 现 , OFC 决 
定 个 体 在 奖励 预测 误差 和 虚构 错误 等 社会 认 知 任 
务 中 的 行为 表现 (Boorman, O'Doherty, Adolphs, & 
Rangel, 2013; Jonker, Jonker, Scheltens, & Scherder, 
2015). 

vmPFC 在 目标 导向 行为 习 得 过 程 中 起 着 重要 
作用 ,特别 是 对 动态 变化 的 行为 结果 的 价值 评估 
(O'Doherty, 2011; Tanaka, Balleine, & O'Doherty, 
2008; Wunderlich et al., 2012)， 同 时 还 参与 情感 整 
合 评估 和 行为 调节 (Apergis-Schoute et al., 2017). 
De Wit Corlett, Aitken, Dickinson 和 Fletcher (2009) 
等 人 使 用 fMRI 考 察 健康 成 年 人 在 进行 OD 任务 时 
大 脑 的 活动 状况 ,结果 发 现 当 行为 的 潜在 奖赏 发 
生变 化 后 , 被 试 在 进行 决策 时 vmPFC 激活 显著 增 
强 。Plassmann 等 人 采用 支付 意愿 范式 (willingness 
to pay) 通 过 拍卖 的 方式 ， 被 试 可 以 购买 避免 吃 厌 
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恶 食物 的 权利 ,在 自由 支付 任务 中 ， 出 价 高 低 表 
明 对 食物 的 欲望 和 厌恶 程度 ; 通过 考察 自由 任务 
的 支付 情况 ,衡量 大 脑 在 每 次 支付 决策 过 程 估计 
的 厌恶 目标 值 ， 结 果 发 现 vmPFC 的 激活 会 随 着 结 
果 湾 在 价值 的 改变 而 改变 (Plassmann，O'Doherty, 
& Rangel, 2010)。 

尾 状 核 是 额 叶 -内 侧 纹 状 体 环 路 中 认 知 控制 
子 环 路 的 核心 成 分 在 行为 抑制 、 调 节 中 起 作用 
(Jahanshahi et al., 2015)。 以 往 研究 显示 DMS 参与 
奖赏 加 工 与 操作 性 行为 习 得 ; 也 有 研究 者 认为 纹 
状 体 参 与 目标 导向 行为 策略 选择 (Tricomi, Delgado, 
& Fiez, 2004)。Wunderlich et al. (2012) 采用 基于 
价值 的 决策 任务 (Value-based choice) 发 现 内 侧 尾 
状 核 、 丘 脑 、 双 侧 前 脑 岛 、 背 内 侧 前 额 叶 皮 质 在 
目标 导向 学 习 中 激活 显著 增强 ， 并 进一步 指出 内 
侧 纹 状 体 更 多 参与 计划 加 工 ， 其 从 属于 一 个 综合 
的 个 体 行为 反应 价值 的 计算 系统 。Brovelli, Nazarian, 
Meunier 和 Boussaoud (2011) 采 用 强化 学 习 任 务 ， 
发 现 尾 状 核 头 部 与 目标 导向 行为 密切 相关 ， 并 认 
为 尾 状 核 主要 是 对 行为 表现 进行 监测 ， 并 将 这 种 
监测 信息 与 实时 的 认 知 控制 要 求 相 结合 ， 进 而 促 
进 个 体 表现 出 灵活 性 的 反应 模式 ; 尾 状 核 受 损 的 
病人 则 无 法 对 行为 表现 与 任务 要 求 的 变化 进行 整 
合 ， 故 而 难以 习 得 目标 导向 行为 。 然 而 ，Rostami 
等 人 采用 制 糖 厂 任务 (sugar production factory task, 
SPF) 要 求 被 试 在 已 知 工人 数 、 当 前 生产 水 平和 目 
标 生 产 水 平 的 情况 下 ,通过 调整 参与 生产 的 工人 
数量 来 达到 并 保持 指定 目标 水 平 的 糖 产量 。 结 果 
显示 相对 于 目标 值 为 零 的 控制 组 ，SPF 组 被 试 内 
侧 额 叶 激活 降低 ， 但 并 未 发 现 纹 状 体 参 与 到 目标 
导向 的 学 习 任 务 中 , 研究 者 认为 可 能 是 SPF 任务 
及 其 行为 -结果 联结 的 特殊 性 所 致 (Rostami, 
Hosseini, Takahashi, Sugiura, & Kawashima, 2009). 

还 有 研究 发 现 其 他 一 些 脑 区 也 参与 目标 导向 
学 习 的 过 程 中 。 如 与 工作 记忆 相关 的 右 侧 下 顶 叶 
(right inferior parietal lobule, IPL),， 可 能 与 目标 导 
向 信息 加 工 过 程 中 工作 记忆 的 负载 有 关 (Rostami 
et aL, 2009); 与 执行 控制 有 关 的 背 外 侧 前 额 叶 皮 
质 , 研究 发 现 用 经 颅 磁 刺激 (Transcranial Magnetic 
Stimulation，TMS) 干 扰 背 外 侧 前 额 叶 皮质 时 ， 被 
试 的 目标 导向 学 习 则 会 受 损 ， 更 倾向 于 习惯 化 反 
应 (Smittenaar, FitzGerald, Romei, Wright, & Dolan, 
2013). ES TH RE JI AEE 4 47 Hr (Spreng, Stevens, 


Chamberlain, Gilmore, & Schacter, 2010) 结 果 也 发 
现 , 额 项 控制 网 络 可 根据 任务 要 求 灵活 地 调节 默 
认 网 络 与 背 侧 注意 网 络 以 共同 完成 目标 导向 任务 ， 
其 中 默认 网 络 主要 涉及 自传 体 计划 ,而 背 侧 注意 
网 络 主要 涉及 视觉 空间 计划 。 


3 ”习惯 学 习 系 统 及 其 神经 机 制 研 究 


习惯 学 习 系 统 主要 涉及 由 壳 核 与 SMA 构成 
的 前 额 叶 - 背 外 侧 纹 状 体感 觉 运动 环 路 (sensorimotor 
fronto-striatal loop) (Brovelli et al, 2011; 
Jahanshahi et al., 2015; Wunderlich et al., 2012) 为 
核心 的 广泛 脑 区 ， 如 脑 岛 、 杜 中 回 、 体 感 联合 区 
和 中 央 后 回 等 区 域 (Ashby, Turner, & Horvitz, 2010; 
Balleine & O'Doherty, 2010; Isoda & Hikosaka, 
2011; Tricomi, Balleine, & O'Doherty, 2009)。 神 经 
解剖 研究 显示 ， 辅 助 运动 区 到 壳 核 的 神经 投射 与 
习惯 行为 产生 有 紧密 关系 (Ito & Doya, 2015; Postuma 
& Dagher, 2006; Schiltz, 2006)。 来 自 运动 区 域 的 信 
号 投射 至 壳 核 经 由 Gpi、 黑 质 、STN 等 区 域 反馈 
至 额 叶 激 发 个 体 的 行为 反应 。 脑 损伤 研究 显示 ， 
DLS 受 损 的 动物 在 过 度 训 练 后 仍然 对 行为 结果 
分 敏感 ， 无 法 形成 习惯 性 行为 模式 ， 这 说 明 背 外 
侧 纹 状 体 在 习惯 行为 产生 中 起 重要 作用 (Yin et al., 
2004)。 神 经 递 质 研究 显示 ,在 额 叶 - 纹 状 体 -下 匡 
脑 - 额 叶 直接 通路 中 , 额 叶 和 ACC 释放 兴奋 性 谷 
氨 酸 到 纹 状 体 , 促进 纹 状 体 分 泌 大 量 GABA 到 
GPi 与 SN, 进而 减少 两 者 对 丘脑 的 抑制 ,导致 丘 
脑 释放 大 量 的 兴奋 性 谷 氨 酸 至 额 叶 皮层 ， 激 发运 
动 和 促进 行为 ,这 与 习惯 学 习 的 产生 密切 相关 
(Haber, 2016; Jahanshahi et al., 2015)。 

大 量 关 于 习惯 行为 习 得 机 制 的 研究 都 是 基于 
动物 实验 , 为数 不 多 的 以 人 为 被 试 的 研究 也 得 出 
相似 的 结果 。 一 项 基于 食物 的 OD 范式 研究 显示 ， 
在 随后 的 习惯 行为 倾向 测试 中 ， 经 过 三 天 过 度 训 
练 的 健康 成 年 被 试 比 简短 训练 (一 天 ) 对 照 组 被 试 
在 壳 核 表现 出 更 强 的 激活 (Tricomi et al., 2009), HE 
Dh, 过 度 训 练 组 被 试 的 壳 核 与 前 运动 区 的 功能 连 
接 增 强 (De Wit et al., 2012)， 这 进一步 验证 了 壳 核 
在 人 类 习惯 行为 习 得 中 的 作用 。Morris 等 (2016) 
研究 也 发 现 ， 壳 核 、 辅 助 运动 区 组 成 的 运动 环 路 
与 习惯 行为 习 得 机 制 密切 相关 。Wunderlich 等 
(2012) 发 现 外 侧 后 部 壳 核 . 脑 岛 后 部 延伸 至 里 中 回 
及 体感 联合 区 、 中 央 后 回 在 过 度 训 练 的 情景 中 激 
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活 更 强 ; 壳 核 后 部 的 血 氧 水 平 依赖 信号 (blood 
oxygen level dependent, BOLD) 在 过 度 训 练 情景 下 
做 出 行为 反应 时 增强 , BOLD 信和 号 反映 了 大 脑 含 
氧 血红 蛋白 与 脱氧 血红 蛋白 比例 的 变化 ， 即 任务 
相关 脑 区 神经 活动 的 改变 , 研究 结果 进一步 提示 
了 该 脑 区 与 习惯 学 习 系 统 的 密切 关系 。Brovelli 
等 人 采用 Arbitrary visuomotor learning 任务 ， 被 试 
需要 在 重复 测验 中 完成 视觉 线索 与 手指 运动 之 间 
的 正确 关联 学 习 ， 每 次 测验 结束 均 给 予 结果 反 
馈 。 结 果 发 现 壳 核 主 要 负责 加 工 条 件 刺激 在 多 大 
程度 上 导致 正确 的 反应 ， 是 习惯 学 习 系 统 的 核心 
区 域 (Brovelli et al., 2011)。 


4 目标 导向 学 习 系统 与 习惯 学 习 系 统 
在 具体 研究 中 的 应 用 


近年 来 , 国内 外 研究 者 从 个 体 行为 学 习 双 系 
统 目标 导 问 学 习 系 统 与 习惯 学 习 系 统 的 影响 
因素 角度 进行 了 大 量 相关 人 研究。 通过 采用 一 系列 
经 典 的 实验 任务 ， 如 一 部 分 研究 针对 特殊 群体 普 
i T Æ W E A Ai íT (Gillan, Michal, Robert, 
Phelps, & Daw, 2016)， 如 强迫 证 (Gillan & Robbins, 
2014)、 自 闭 症 (Alvares et al., 2016; Geurts & de Wit, 
2014; Salowitz et al., 2013), # JE JE (Alvares, 
Balleine, & Guastella, 2014; Alvares et al., 2016), 
精神 分 裂 症 (Culbreth et al., 2016; Morris, Quail, 
Griffiths, Green, & Balleine, 2015), 、 帕 金森 症 (De 
Wit et al., 2011; Hadj-Bouziane et al., 2013), HEHE 
fiE(Voon et al.，2015) 等 , 研究 显示 这 些 疾病 均 表 
现 出 目标 导向 系统 与 习惯 系统 的 失衡 。 另 一 些 研 
究 针 对 其 他 因素 ， 如 老化 (De Wit, van de Vijver, & 
Ridderinkhof，2014) 、 应 激 (Maier,，Makwana, & 
Hare, 2015; Plessow, Kiesel, & Kirschbaum, 2012; 
Schwabe & Wolf, 2011) 等 也 发 现 两 种 学 习 系 统 的 
失调 。 
4.1 强迫 症 

强迫 症 (obsessive-compulsive disorder, OCD) 
是 一 种 以 强迫 行为 、 观 念 为 主要 特征 的 慢性 、 易 
迁延 性 精神 疾病 ,强迫 行为 是 强迫 症 最 为 核心 的 
外 显 临 床 表 现 (Gillan & Robbins, 2014; Pauls, 
Abramovitch, Rauch, & Geller, 2014)。 近 年 来 ， 有 
研究 者 指出 OCD 患者 强迫 行为 与 目标 导向 行为 
系统 和 习惯 学 习 系 统 缺 损 有 关 (Gillan et al., 2014a, 
2014b, 2015, Gillan & Robbins, 2014; Vaghi et al., 


2017). 

Gillan 等 人 (2011) 采 用 OD 范式 发 现 OCD 病 
人 对 于 行为 -结果 联结 的 学 习 明 显 弱 于 正常 对 照 
组 , 病人 组 在 任务 中 普遍 表现 出 一 种 习惯 性 偏向 
反应 。 随 后 一 项 基于 反 事 实 思 维 决策 任务 研究 
(Gillan et al., 2014a)， 通 过 对 行为 结果 奖赏 比例 的 
操纵 ,考察 病人 根据 反 事实 思维 有 目的 地 对 行为 
进行 调整 的 能 力 , 结果 也 显示 与 正常 对 照 组 相 比 ， 
OCD 患者 在 进行 反 事实 思维 决策 时 明显 存在 缺陷 。 

此 外 ,鉴于 OCD 患者 大 多 数 行为 都 属于 逃避 
性 反应 , Gillan 等 人 (2014b) 采 用 逃避 电击 OD 范式 
研究 发 现 OCD 患者 对 于 已 经 撤消 电击 的 刺激 材 
料 依然 表现 出 过 渡 的 逃避 反应 ， 且 这 种 习惯 性 逃 
避 反 应 的 习 得 与 尾 状 核 的 过 度 激 活 密切 相关 ， 尾 
状 核 激活 强度 与 习惯 反应 倾向 呈正 相关 ， 即 病人 
习惯 性 反应 倾向 越 强 烈 , 则 尾 状 核 的 激活 水 平 高 
(Gillan et al., 2015)。Banca 等 人 (2015) 采 用 症状 诱 
发 任务 范式 , 通过 呈现 并 操纵 与 疾病 相关 刺激 线 
R, 考察 在 症状 诱发 情境 下 ， 两 种 学 习 系 统 的 关 
系 , 结果 显示 , 诱发 状态 下 OCD 病人 尾 状 核 - 前 
额 叶 环 路 激活 增强 ,同时 STN \ 壳 核 激 活 降低 ， 即 
症状 诱发 状态 下 病人 目标 导向 学 习 系 统 与 习惯 学 
习 系 统 均 存 在 紊乱 。 最 新 研究 也 发 现 (Vaghi et al., 
2017)， 静 息 状 态 下 额 叶 - 纹 状 体 环 路 异常 与 认 知 
灵活 性 、 目 标 导 向 学 习 缺 损 密 切 相关 。 

综 上 所 述 ， 基 于 操作 性 学 习 的 任务 显示 ， 强 
迫 行为 的 产生 是 由 于 目标 导向 系统 的 缺损 ,， (具体 
综述 见 Gillan & Robbins, 2014) 导 致 病人 只 能 依赖 
于 习惯 学 习 系 统 进行 反应 ; 而 在 症状 诱发 状态 下 
病人 目标 向 系统 与 习惯 系统 均 表 现 出 异常 (Banca 
et al., 2015)。 这 说 明 在 不 同 状态 下 ,操作 性 学 习 任 
务 (Gillan & Robbins, 2014)、 症 状 诱发 状态 (Banca 
et al., 2015), FEER (Vaghi et al., 2017) OCD #& 
者 表现 出 的 行为 学 习 系 统 失衡 可 能 存在 一 定 变 化 
差异 ， 即 病人 的 行为 学 习 系 统 会 随 着 病情 及 任务 
状态 呈现 动态 变化 。 
42 自 闭 症 

重复 、 刻 板 行为 是 自 闭 症 (autism spectrum 
disorders，ASD) 患 者 的 核心 临床 表现 之 一 ， 也 是 
自 闭 症 行为 干预 的 关键 环节 (Ruble, 2001)。 有 研究 
者 指出 ASD 患者 的 重复 、 刻 板 行为 与 目标 导向 学 
习 系 统 和 习惯 学 习 系统 失调 有 关 (Alvares et al., 
2016; Geurts & de Wit, 2014; Salowitz et al., 2013). 
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Zalla, Labruyere 和 Georgieff (2006) 发 现 ASD 
儿童 在 表征 系列 目标 导向 行为 时 存在 缺陷 这 可 
能 导致 自 闭 症 患 者 执行 功能 缺陷 、 难 以 理解 他 人 
行为 意图 。Alvares 等 (2016) 采 用 以 食物 为 奖励 的 
OD 范式 发 现 虽 然 ASD 患者 对 贬值 的 食物 结果 表 
观 出 较 低 愉悦 度 评分 ,但 其 对 结果 价值 的 变化 依 
日 不 敏感 ， 且 难以 表现 出 目标 导向 学 习 , 说明 其 
刻板 行为 可 能 是 对 行为 控制 的 缺乏 所 致 Salowitz 
等 (2013) 采 用 目标 导向 视频 游戏 范式 ， 要 求 ASD 
儿童 在 MRI 扫描 过 程 中 完成 视频 游戏 ， 进 行 目标 
导向 的 手腕 弯曲 或 伸展 运动 ,并 根据 运动 时 间 和 
移动 范围 获得 相应 得 分 ,结果 显示 ASD 儿童 与 正 
常 儿 童 在 行为 运动 学 反应 上 并 未 存在 差异 ,但 正 
常 儿 童 组 的 反应 启动 与 额 叶 活动 呈正 相关 , ASD 
儿童 组 则 表现 出 负 相 关 , 文中 提出 要 同时 采用 自 
动 任务 操纵 与 脑 影 像 扫 描 来 研究 自 闭 症 儿 童 目标 
导向 行为 的 可 行 性 。 影像 学 研究 也 指出 ASD 患 
的 dlPFC (Just, Keller, Malave, Kana, & Varma, 
2012; Yasumura et al., 2012)、ACC (Delmonte, 
Gallagher, O'Hanlon, Mcgrath, & Balsters, 2013), 


纹 状 体 (Just et al., 2012; Langen et al., 2012) 等 区 


ud 


Rose, Brown, Field, & Hogarth, 2013; Sebold et al., 
2014), 259] ES (Mole et al., 2015; Sjoerds, Luigjes, 
Brink, Denys, & Yücel, 2014), 、 烟 草 成 次 (Hogarth 
et al.，2015) 等 行为 与 目标 导向 学 习 系 统 和 习惯 学 
习 系 统 的 失衡 有 关 。 
Mole 等 (2015) 采 用 基于 CD 范式 的 二 阶段 序 
列 学 习 任 务 ， 对 第 一 阶段 习 得 的 行为 与 奖赏 结果 
的 概率 进行 操作 ， 发 现 酒精 成 瘾 患者 难以 根据 概 
率 变化 对 行为 进行 调整 ， 即 表现 出 目标 导向 学 习 
系统 缺损 , 但 其 习惯 行为 反应 与 正常 对 照 组 不 存 
在 差异 ,酒精 成 瘾 患者 从 目标 导向 行为 到 习惯 行 
为 的 转变 可 能 与 其 成 疯 行 为 的 逐渐 加 重 有 关 。 
Dickinson 等 人 发 现 相 比较 于 中 性 刺激 ,酒精 更 易 
导致 习惯 反应 倾向 (Dickinson,，Wood, & Smith, 
2002). 然而 Corbit 等 人 发 现 酒精 暴露 能 够 增加 对 
中 性 刺激 的 习惯 反应 倾向 ,， DMS 对 于 反应 的 控制 
逐渐 让 位 于 DLS (Corbit, Nie, & Janak, 2012)。 
Ostlundet 等 人 发 现 与 酒精 相关 的 线索 也 会 对 目标 
导向 行为 产生 不 良 影响 (Ostlund,，Maidment，& 
Balleine, 2010)。 酒 精 成 瘾 对 两 种 行为 系统 的 影响 
可 能 与 其 对 有 额 叶 - 纹 状 体 环 路 的 作用 有 关 ， 特别 


域 存在 激活 异常 ， 而 这 些 脑 区 都 与 目标 导向 学 习 
系统 密切 相关 。 

尽管 有 研究 者 发 现 ASD 患者 存在 目标 导向 
学 习 系 统 与 习惯 学 习 系统 的 失调 , 但 Geurts 和 de 


是 前 额 叶 与 纹 状 体 脑 区 (Barker & Taylor, 2014; 
Everitt & Robbins, 2013)。 此 外 ， 有 研究 者 发 现 药 
物 成 瘾 患者 同样 表现 出 明显 的 习惯 性 反应 偏向 ， 
这 种 反应 偏向 可 能 源 于 目标 导向 系统 的 缺损 ， 也 


Wit (2014) 采 用 图 片 材料 OD 范式 发 现 ASD 儿童 
与 正常 儿童 表现 没有 差异 ， 即 ASD 儿童 两 种 行为 
学 习 系 统 并 没 表 现 出 失调 。 鉴于 ASD 研究 的 特殊 
性 ， 当 前 研究 数量 较 少 ， 且 结果 存在 异 质 性 在 一 
定 程度 上 是 可 以 理解 的 ,一 方面 ASD 患者 本 身 伴 
随 着 各 种 异 质 性 的 认 知 、 心 理 问题 ,可 能 导致 研 
究 结果 的 差异 (Geurts & de Wit, 2014); 另 一 方面 
鉴于 大 多 数 研 究 以 儿童 、 青 少年 为 被 试 ， 无 论 是 
行为 研究 还 是 脑 影像 学 研究 ， 无关 变 量 的 控制 始 
终 存 在 一 定 难度 (Geurts & de Wit, 2014; Salowitz 
et al., 2013). 因此 , ASD 患者 刻板 行为 与 两 种 行为 
学 习 系 统 之 间 的 关系 ， 以 及 如 何 从 行为 学 习 角 度 
系统 地 开发 出 切实 有 效 的 行为 干预 方法 有 待 进 一 
43 XE 

冲动 、 刻 板 行为 也 是 物质 依赖 患者 的 特征 之 
一 ， 近 年 来 一 些 研究 者 指出 物质 依赖 患者 ， 如 酒 
Té ES (Hogarth, Attwood, Bate, & Munafo, 2012; 


可 能 与 习惯 性 行为 系统 的 活动 增强 有 关 (Everitt & 
Robbins, 2005)。 然 而 ,近期 有 研究 者 (Nebe et al., 
2017) 采 用 操作 性 学 习 范 式 和 任务 态 磁 共 振 扫描 ， 
发 现 其 与 酒精 成 瘾 之 间 并 没有 直接 关系 。 

还 有 研究 者 指出 ， 负 性 情绪 不 仅 会 影响 被 试 
在 OD 范式 中 的 目标 导向 行为 ,还 会 增强 其 对 于 
烟草 的 需求 (Hogarth et al., 2015). RIEZ Sh, WRA 
与 目标 导向 学 习 缺 损 之 间 的 关系 还 与 其 他 风险 因 
素 相关 ， 如 家 族 史 、 认 知 负 荷 、 冲 动 性 特质 等 
(Reiter, Deserno, Wilbertz, Heinze, & Schlagenhauf, 
2016)。 因 此 ， 从 目前 已 有 研究 来 看 ， 一 方面 物质 
成 瘾 患者 本 身 存 在 两 种 行为 学 习 系 统 的 缺损 
(Sebold et al, 2014); 2j 一 方面 暴露 于 烟草 
(Hogarth et al., 2015)、 酒 精 (Corbit et al., 2012) 等 
情景 也 会 导致 个 体 两 种 学 习 系 统 的 失 平衡 。 但 病 
人 表现 出 来 的 冲动 、 重 复 行为 究竟 是 由 暴露 于 特 
殊 环 境 而 引起 的 失 平 衡 , 还 是 其 内 在 固有 的 缺 
失 ? 这 有 待 以 后 进一步 研究 。 
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4.4 压力 与 应 激 

压力 与 应 激 是 当前 社会 面临 的 严重 问题 之 一 
大 量 研究 显示 处 于 应 激 状 态 下 的 个 体 ， 认 知 与 决 
策 行为 会 受到 一 定 损害 , 特别 是 目标 导向 学 习 系 
统 与 习惯 学 习 系 统 的 转换 ,研究 结果 一 致 指出 压 
力 会 损害 个 体 的 目标 导向 学 习 系 统 (Maier et al., 
2015; Schwabe & Wolf, 2011)。 

Schwab 和 Wolf (2010) 等 人 采用 社会 评价 冷 
压力 测试 (socially evaluated cold pressor test) 范 式 ， 
让 被 试 将 手 置 于 低温 冰 水 中 ,同时 结合 社会 性 评 
ffr, 创设 应 激情 景 和 以 食物 为 奖赏 的 OD 范式 发 
现 ， 相 比较 于 正常 对 照 组 ,压力 组 被 试 表 现 出 过 
度 的 习惯 倾向 ， 这 种 习惯 倾向 与 皮质 醇 的 反应 密 
切 相 关 。Plessow 等 (2012) 采 用 实验 者 社会 压力 范 
式 (Trier Social Stress Test), 任务 内 容 包 括 公 开演 
讲 与 心算 ， 并 对 被 试 的 表现 给 予 社会 性 评价 ， 进 
而 创设 应 激情 景 ， 考察 急性 心理 应 激 对 目标 灵活 
性 任务 认 知 控制 过 程 的 影响 ,并 重点 关注 了 下 丘 
脑 - 垂 体 - 肾 上 腺 轴 (hypothalamic-pituitary-adrenal 
axis, HPA) 的 压力 反应 。 结 果 发 现 ， 应 激 组 被 试 在 
应 激 源 暴露 后 立即 表现 出 唾液 a- 淀 粉 酶 活性 升 高 ， 
应 激 停止 后 10 分 钟表 现 出 唾液 皮质 醇 升 高 ， 这 反 
映 了 其 交感 神经 系统 和 HPA 轴 中 典型 的 与 应 激 相 
关 活 动 的 增加 。 处 于 应 激 中 的 个 体 在 任务 转换 和 
任务 重复 之 间 表 现 出 比 控制 组 更 大 的 差异 ， 进 一 
步 说 明 急性 心理 社会 压力 会 影响 认 知 灵活 性 ， 进 
而 损害 目标 导向 行为 。 此 外 ，Maier 等 人 (2015) 对 
应 激 对 于 目标 导向 学 习 的 神经 机 制 的 影响 进行 了 
RR, 发现 压力 会 导致 个 体 对 于 即时 奖赏 的 冲动 
性 反应 的 增加 和 认 知 控制 能 力 的 降低 ， 这 种 行为 
模式 伴随 着 vmPFC 和 杏仁 核 、 纹 状 体 之 间 功 能 连 
接 的 增强 ; 同时 压力 与 vmPFC 和 dlPFC 的 功能 连 
接 减 弱 有 关 ， 即 压力 一 方面 增强 即时 奖赏 的 作用 ， 
另 一 方面 降低 与 长 期 目标 有 关 的 行为 控制 的 效率 ， 
进而 导致 个 体 目标 导向 行为 受 损 。 据 此 ， 有 研究 
者 指出 应 激 可 以 调节 基于 前 额 叶 皮质 的 目标 导向 
过 程 和 基于 背 外 侧 纹 状 体 的 习惯 过 程 , 使 得 操作 
性 行为 更 偏向 于 习惯 (Schwabe & Wolf, 2011). 

关于 应 激 如 何 影响 目标 导向 学 习 系 统 与 习惯 
学 习 系 统 ，Schwabe 和 Wolf (2011) 认 为 应 激 通 过 
影响 个 体 的 学 习 记忆 过 程 ， 如 工作 记忆 、 执 行 控 
制 能 力 、 认 知 灵活 性 等 进而 影响 目标 导向 学 习 ， 
其 具体 机 制 涉及 以 前 额 叶 为 核心 的 广泛 脑 区 ， 如 


杏仁 体 、 海 马 等 。 应 激 对 目标 导向 行为 的 影响 是 
在 习 得 阶段 还 是 反应 表现 阶段 ， 有 待 进一步 研究 ， 
具体 可 参照 Schwabe & Wolf, 2011。 此 外 ,慢性 应 
激 与 急性 应 激 对 于 两 种 行为 学 习 系 统 的 影响 机 制 
是 否 相同 也 尚 不 清楚 。 

综 上 所 述 , 无 论 是 精神 疾病 还 是 伴随 特定 情 
景 的 特殊 心理 状态 ， 亦 或 是 两 者 的 交互 作用 , 均 
有 可 能 导致 目标 导向 学 习 系统 与 习惯 学 习 系统 的 
失衡 或 缺损 ， 进 而 引起 重复 、 刻 板 等 行为 。 自 闭 
证、 强迫 症 、 成 瘾 等 精神 疾病 所 表现 出 的 行为 问 
题 是 当前 干预 治疗 研究 中 需要 突破 的 关键 环节 。 
通过 对 这 些 特 殊 群 体 行为 学 习 系 统 的 考察 ， 将 有 
助 于 开发 各 种 针对 性 的 干预 方案 与 措施 ,也 有 助 
于 促进 对 这 两 种 行为 学 习 系统 在 个 体 认 知心 理 功 
能 中 具体 作用 的 认识 。 


5 总 结 


Ws =A 


目标 导向 学 习 系 统 与 习惯 学 习 系 统 在 个 体 日 
常生 活 中 发 挥 着 至 关 重 要 的 作用 。 经 过 半 个 世纪 
的 研究 ， 从 行为 研究 到 神经 探索 再 到 计算 机 模拟 ， 
人 们 对 于 两 种 行为 学 习 系 统 的 关系 与 机 制 有 了 充 
分 的 了 解 ， 区 分 了 前 额 叶 - 尾 状 核 环 路 、 辅 助 运动 
区 - 壳 核 环 路 在 两 种 行为 学 习 系 统 中 的 具体 作用 。 
研究 者 们 进一步 对 特殊 群体 ， 如 强迫 症 、 自 闭 症 、 
成 瘾 患者 等 在 两 种 行为 学 习 系 统 的 差异 (或 表现 ) 
进行 了 探索 ,以 寻找 临床 症状 与 两 种 行为 学 习 系 
统 之 间 的 关系 ,为 早期 预防 和 行为 干预 提供 新 
途径 。 然 而 ， 当 前 研究 依旧 存在 一 些 急 待 解决 的 
问题 : 

1) 目标 导向 学 习 系 统 与 习惯 系统 是 一 分 为 
二 的 关系 吗 ?” 有 些 研究 者 提出 两 种 学 习 系 统 并 不 
是 绝对 对 立 的 关系 ， 而 是 既 存 在 竞争 也 存在 合作 
(Cushman & Morris, 2015)。 那么 这 种 动态 的 竞争 - 
合作 关系 是 如 何 演变 的 ? 

2) 目标 导向 学 习 系 统 与 习惯 学 习 系 统 相 关 
神经 网 络 是 否 存在 功能 与 结构 上 的 重 辣 ? 有 研究 
者 发 现 腹 侧 纹 状 体 活动 同时 反应 了 两 种 学 习 系 统 
活动 (Daw，Gershman， Seymour, Dayan, & Dolan, 
2011)， 两 种 学 习 系 统 存在 一 定 整合 的 神经 机 制 。 
从 大 脑 功能 整合 的 角度 来 看 , 大 脑 活动 往往 是 以 
网 络 的 方式 整体 活动 。 两 种 行为 学 习 系 统 的 竞争 一 
合作 关系 在 神经 机 制 上 是 如 何 体现 的 ? 

3) 众所周知 ， 临 床 心理 与 行为 表现 会 随 着 疾 
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病 的 进程 而 变化 , 若 病 人 的 行为 问题 由 目标 导向 
系统 与 习惯 系统 失调 引起 ,那么 这 种 失调 在 患 
前 、 发 病 中 、 干 预 前 后 是 否 存在 动态 的 变化 ， 如 
何 变 化 ?这 些 问题 , 均 有 待 后 续 研 究 深 入 探索 。 
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The neural mechanisms of goal-direct and habitual learning system 
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Abstract: The dual system model of behavior learning recognizes two distinct systems: goal-directed 
system and habitual system. The goal-directed system, encoding the action-outcome behavior, is associated 
with caudate, ventromedial prefrontal cortex (vmPFC) and orbitofrontal cortex (OFC). The habitual system, 
concerning stimulus-response behaviors, is associated with the putamen and supplementary motor area 
(SMA). Research paradigms for these two behavioral learning systems mainly include outcome devaluation 
and contingency degradation paradigms. A large number of studies have found a dynamic defect of 
goal-direct learning system and habitual learning system in obsessive-compulsive disorder, autism, 
addiction and other mental disorders. 
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